Проектная работа

Рынок заведений общественного питания Москвы

Описание проекта Инвесторы из фонда «Shut Up and Take My Money» решили попробовать себя в новой области и открыть заведение общественного питания в Москве. Заказчики ещё не знают, что это будет за место: кафе, ресторан, пиццерия, паб или бар, — и какими будут расположение, меню и цены. Для начала они просят вас — аналитика — подготовить исследование рынка Москвы, найти интересные особенности и презентовать полученные результаты, которые в будущем помогут в выборе подходящего инвесторам места. Описание данных Файл *moscow_places.csv*: * name — название заведения; - address — адрес заведения; - category — категория заведения, например «кафе», «пиццерия» или «кофейня»; - hours — информация о днях и часах работы; - lat — широта географической точки, в которой находится заведение; - lng — долгота географической точки, в которой находится заведение; - rating — рейтинг заведения по оценкам пользователей в Яндекс Картах (высшая оценка — 5.0); - price — категория цен в заведении, например «средние», «ниже среднего», «выше среднего» и так далее; - avg_bill — строка, которая хранит среднюю стоимость заказа в виде диапазона, например: *«Средний счёт: 1000–1500 ₽»;* *«Цена чашки капучино: 130–220 ₽»;* *«Цена бокала пива: 400–600 ₽».* *и так далее;* - middle_avg_bill — число с оценкой среднего чека, которое указано только для значений из столбца avg_bill, начинающихся с подстроки «Средний счёт»: Если в строке указан ценовой диапазон из двух значений, в столбец войдёт медиана этих двух значений. Если в строке указано одно число — цена без диапазона, то в столбец войдёт это число. Если значения нет или оно не начинается с подстроки «Средний счёт», то в столбец ничего не войдёт. - middle_coffee_cup — число с оценкой одной чашки капучино, которое указано только для значений из столбца avg_bill, начинающихся с подстроки «Цена одной чашки капучино»: Если в строке указан ценовой диапазон из двух значений, в столбец войдёт медиана этих двух значений. Если в строке указано одно число — цена без диапазона, то в столбец войдёт это число. Если значения нет или оно не начинается с подстроки «Цена одной чашки капучино», то в столбец ничего не войдёт. chain — число, выраженное 0 или 1, которое показывает, является ли заведение сетевым (для маленьких сетей могут встречаться ошибки): 0 — заведение не является сетевым 1 — заведение является сетевым - district — административный район, в котором находится заведение, например Центральный административный округ; - seats — количество посадочных мест. Ход исследования - Изучение общей информации - Предобработка данных - Анализ данных - Детализируем исследование: открытие кофейни - Подготовка презентации

Шаг 1. Изучение общей информации

Комментарий:

Всего представлено 5614 уникальных заведений. На первый взгяд много пропусков. Можно посчитать долю пустых значений этих столбцов для наглядности. Есть довольно высокая оценка среднего чека - 35000, также максимальное колиество посадочных мест - 1288 (это очень много). Тип столбца seats 64-битное число с плавающей запятой, что некорректно.

Шаг 2. Предобработка данных

Огромное количество посадочных мест в заведении 'японская кухня'. Непохоже на название, возможно стоит удалить такие места, чтобы не исказить данные выбросами.

Комментарий:

Явных дубликатов нет, посмотрим неявные. Наверняка заведений с одинаковым названием, улицей и районом нет.

3 совпадения, удалим их.

Много пропусков с столбцах hours, price, avg_bill, middle_avg_bill, middle_coffee_cup, seats. Пропуски в данном случае нельзя удалить, так как это может исказить данные.

Посмотрим на названия дубликатов, которые не являются сетевыми.

Заведения с названиями столовая, ресторани прочие, которые не являются сетевыми, стоит удалить из таблицы. Они могут исказить данные, особенно для выявления топ-15.

Шаг 3. Анализ данных

Категории заведений

Посмотрим, какие категории заведений представлены в данных. Исследуем количество объектов общественного питания по категориям. Построим визуализации.

Комметарий:

Всего 8 категорий. Топ-3:

Первые три категории составляют 69% от общего числа заведений.

Наименее популярная категория - cтоловые и булочные. Они составляют 6% от общего числа заведений.

Кафе и ресторан являются местом для долгих посиделок, деловых и дружеских встреч, семейных праздников. Они рассчитаны на широкую аудиторию с разнообразным меню и кухней. Могут располагаться почти везде: рядом с деловыми центрами, городскими парками, в спальном районе. Особой популярностью пользуются бизнес-ланчи и завтраки в кафе.

Кофейни сегодня пользуются довольно хорошим спросом в связи с ритмом жизни людей. Сюда заходят ненадолго и чаще всего берут на вынос. Подходят для недолгих встреч, быстрых обедов с кофе, но меню содержит ограниченное количество блюд - в основном, это выпечка и десерты.

Бары (764) пользуются спросом у молодежи и людей средних лет. Актуально для встреч коллег после рабочего дня, для встречи с друзьями.

Пиццерия (633) обладает ограниченным ассортиментом и работает на доставку.

Быстрое питание (603) обычно находятся в торговых центрах, бизнес-центрах, где люди питаются между делами.

Столовые (315) обычно располагаются рядом с университетами, школами, государственными учреждениями, где есть большой поток людей.

Булочные (256) на на последнем месте(256 заведений). Подходит для быстрого перекуса или покупкой выпечки после рабочего дня.

Количество посадочных мест по категориям

Соотношение сетевых и несетевых заведений

Какие категории заведений чаще являются сетевыми?

Топ-15 популярных сетей в Москве

Общий признак, который объединяет эти сети - шаговая доступность от общественного транспорта (метро, автобусы) и расположение в районе с большим потоком людей. Также стоит отметить предельный уровень среднего чека, что благоприятно влияет на покупательную способность населения (предсказуемость цен при посещении, что облегчает выбор для людей). Часто люди выбирают знакомые места в незнакомых местах.

Комментарий:

Кофейни популярны, потому что сочетают в себе функциональность (кофе + еда + работа). К тому же особая атмосфера, любовь к кофе и привычка создавать себе ритуал делают кофейни более востребованными в обществе.

Административные районы Москвы. Общее количество заведений и количество заведений каждой категории по районам.

В центральном административном округе сосредоточены офисы, туристические достопримечательности, бизнес-центры. Значит, там большая проходимость. Развитая инфраструктура так же играет ключевую роль: общественный транспорт, удобные пешеходные переходы, развлекательные объекты. Здесь высокая конкуренция, но разнообразие заведений только привлекает поток посетителей. Оплата аренды выше, но есть большая вероятность окупиться.

Распределение средних рейтингов по категориям заведений

Фоновая картограмма (хороплет) со средним рейтингом заведений каждого района

В ЦАО за рейтинг самый высокий - 4.38.

Заведения датасета на карте

По карте наглядно видно, что больше всего заведений в центре Москвы, т.е. в ЦАО.

Топ-15 улиц по количеству заведений

Комментарий:

Проспект Мира является одной из главных радиальных проспектов Москвы, здесь состредоточены исторические достопримечательноси, важные траспортные узлы, развитая инфраструктура, престижный уровень жизни. Соединяет ключевые районы: Центр, Алексеевский, Ростокино, ВДНХ, Останкино. Вполне логично, что проспект Мира на первом месте.

Почти то же самое можно сказать и о других популярных улицах - это крупные траспортные магистрали Москвы. Эти улицы соединяют разные части города и влияют на логистику города и жизнь миллионов людей.

Улицы, на которых находится только один объект общепита.

Комментарий:

В общем, ЦАО по количеству заведений лидирует, поэтому среди одиночных заведений стоит на первом месте.

Возможные причины, почему на некоторых улицах Москвы может быть только по одному заведению:

Отдаленность от центра довольно сильно влияет на ценовой диапазон (примерно на 1.5-2 раза).

Выводы:

Шаг 4. Детализируем исследование: открытие кофейни

Количество кофеен и их расположение

Комментарий: В центре ожидаемо много кофеен, большая концентрация и максимальный трафик наблюдается в основном:

Набрали популярность в последние годы скрытые кофейни, которые располагаются во дворах, создавая особу атмосферу для посетителей. Возможно, стоит обратить внимание на такой формат.

Центр привлекателен высокой проходимость и особенностей потребительского поведения: большинство берут кофе на вынос или сидят в кофейнях, создавая себе место для работы.

Круглосуточные кофейни

Круглосуточных кофеен больше всего в ЦАО, но количество довольно мало - 26.

Заведения вынуждены поддерживать высокие стандарты и тщательнее следят за отзывами. Посетители чаще оставляют отзывы в центре и ценовая политика выше, чем в других районах. Также , возможно, в центре чаще проводятся проверки качества соответствующими органами. Комплексный подход заведений благоприятно влияют на рейтинги.

Это возможный показатель перспективности Западной административной области. Конкуренция чуть ниже, чем в ЦАО, лояльная аренда, растущий спрос.

Выводы и рекомендации

https://docs.google.com/presentation/d/1N0feHP_dmexAiWYm3TCiyJs9Awpo2IUD3MFMIWXoGCs/edit?usp=sharing